自动化数据驱动的建模,直接发现系统的管理方程的过程越来越多地用于科学界。 Pysindy是一个Python包,提供用于应用非线性动力学(SINDY)方法的稀疏识别到数据驱动模型发现的工具。在Pysindy的这一主要更新中,我们实现了几种高级功能,使得能够从嘈杂和有限的数据中发现更一般的微分方程。延长候选术语库,用于识别致动系统,部分微分方程(PDE)和隐式差分方程。还实施了包括Sindy和合奏技术的整体形式的强大配方,以提高现实世界数据的性能。最后,我们提供了一系列新的优化算法,包括多元稀疏的回归技术和算法来强制执行和促进不等式约束和稳定性。这些更新在一起,可以在文献中尚未报告的全新SINDY模型发现能力,例如约束PDE识别和使用不同稀疏的回归优化器合并。
translated by 谷歌翻译
本文解决了利益区域(ROI)计算机断层扫描(CT)的图像重建问题。尽管基于模型的迭代方法可用于此问题,但由于乏味的参数化和缓慢的收敛性,它们的实用性通常受到限制。另外,当保留的先验不完全适合溶液空间时,可以获得不足的溶液。深度学习方法提供了一种快速的替代方法,从大型数据集中利用信息,因此可以达到高重建质量。但是,这些方法通常依赖于不考虑成像系统物理学的黑匣子,而且它们缺乏可解释性通常会感到沮丧。在两种方法的十字路口,最近都提出了展开的深度学习技术。它们将模型的物理和迭代优化算法纳入神经网络设计中,从而在各种应用中均具有出色的性能。本文介绍了一种新颖的,展开的深度学习方法,称为U-RDBFB,为ROI CT重建而设计为有限的数据。由于强大的非凸数据保真功能与稀疏性诱导正则化功能相结合,因此有效地处理了很少的截断数据。然后,嵌入在迭代重新加权方案中的块双重前向(DBFB)算法的迭代将在神经网络体系结构上展开,从而以监督的方式学习各种参数。我们的实验显示了对各种最新方法的改进,包括基于模型的迭代方案,深度学习体系结构和深度展开的方法。
translated by 谷歌翻译
重建 /特征提取的联合问题是图像处理中的一项具有挑战性的任务。它包括以联合方式执行图像的恢复及其特征的提取。在这项工作中,我们首先提出了一个新颖的非平滑和非凸变性表述。为此,我们介绍了一种通用的高斯先验,其参数(包括其指数)是空间变化的。其次,我们设计了一种基于近端的交替优化算法,该算法有效利用了所提出的非convex目标函数的结构。我们还分析了该算法的收敛性。如在关节分割/脱张任务进行的数值实验中所示,该方法提供了高质量的结果。
translated by 谷歌翻译
病理系统地诱导形态学变化,从而提供了主要但不足以量化的可观察到诊断来源。该研究基于计算机断层扫描(CT)体积的形态特征(3D形态学)开发了病理状态的预测模型。开发了一个完整的工作流程,以进行网状提取和简化器官表面的工作流程,并与平均曲率和网状能的分布自动提取形态特征自动提取。然后对XGBoost监督分类器进行了训练和测试,以预测病理状态。该框架应用于肺结节恶性肿瘤的预测。在具有恶性肿瘤的NLST数据库的子集中,仅使用3D形态学证实了活检,将肺结节的分类模型分类为恶性与良性AUC的良性0.964。 (1)临床相关特征的其他三组经典特征经过训练和测试,AUC为0.58,(2)111辐射因子学的AUC为0.976,(3)含有结节大小,衰减和衰减和衰减的放射科医生地面真相(GT) Spiculation定性注释的AUC为0.979。我们还测试了Brock模型并获得0.826的AUC。将3D形态学和放射素学特征结合在一起,可以实现最新的结果,而AUC为0.978,其中3D形态学具有一些最高的预测能力。作为对公共独立队列的验证,将模型应用于LIDC数据集,3D形态学的AUC达到0.906,而3D型物体+放射线学则获得了0.958的AUC,在挑战中排名第二。它将曲率分布确定为预测肺结核恶性肿瘤的有效特征,并可以直接应用于任意计算机辅助诊断任务。
translated by 谷歌翻译
在诸如通过移动和在线服务的数字注册之类的情况下,身份文档验证对于有效检测伪造并因此建立对数字世界的用户信任至关重要。在本文中,提出了基于伪造模式的伪造发现的身份文档的身份验证模型。提出的方法由两个步骤组成:一对身份文档的特征向量之间的特征提取和相似度度量。功能提取步骤涉及通过卷积神经网络(CNN)体系结构学习一对身份文档之间的相似性,并通过在它们之间提取高度歧视的特征来结束。同时,采用相似性度量步骤来确定给定的身份文档是真实的还是伪造的。在这项工作中,将这两个步骤组合在一起以实现两个目标:(i)提取的功能应具有良好的抗议(判别性)功能,以区分属于不同类别的一对身份文档,(ii)查看符合的符合性。给定身份文档的Guilloche模式及其与同一国家的真实版本的Guilloche模式相似。进行实验以分析和确定最适当的参数,以实现更高的身份验证性能。实验结果是在MIDV-2020数据集上执行的。结果表明,提出的方法可以提取处理后的身份文档的相关特性,以对Guilloche模式进行建模,从而正确区分它们的能力。此处提供了实现代码和锻造数据集(https://drive.google.com/id-fdgp-1)
translated by 谷歌翻译
自动驾驶汽车广泛使用屋顶旋转的LIDAR传感器,推动了3D点序列实时处理的需求。但是,大多数激光雷达语义细分数据集和算法将这些收购分为$ 360^\ circ $框架,从而导致收购潜伏期与现实的实时应用程序和评估不符。我们通过两个关键贡献来解决这个问题。首先,我们介绍Helixnet,这是一个10亿美元的点数据集,具有细粒度的标签,时间戳和传感器旋转信息,可以准确评估分割算法的实时准备就绪。其次,我们提出了helix4d,这是一种专门设计用于旋转激光雷达点序列的紧凑而有效的时空变压器结构。 Helix4D在采集切片上运行,对应于传感器的全部旋转的一部分,从而大大降低了总延迟。我们介绍了Helixnet和Semantickitti上几种最先进模型的性能和实时准备的广泛基准。 Helix4D与最佳的分割算法达到准确性,而在延迟和型号$ 50 \ times $中,降低了$ 5 \ times $。代码和数据可在以下网址获得:https://romainloiseau.fr/helixnet
translated by 谷歌翻译
分类一直是对对抗攻击的研究的焦点,但是只有少数著作调查了适合于更密集的预测任务的方法,例如语义分割。这些作品中提出的方法不能准确地解决对抗性分割问题,因此,在愚弄模型所需的扰动的大小方面,它过于充满乐趣。在这里,我们基于近端分裂的近端分裂提出了对这些模型的白色盒子攻击,以产生较小的$ \ ell_1 $,$ \ ell_2 $或$ \ ell_ \ ell_ \ infty $ norms的对抗性扰动。我们的攻击可以通过增强的Lagrangian方法以及自适应约束缩放和掩盖策略来处理非covex最小化框架内的大量约束。我们证明,我们的攻击明显胜过先前提出的攻击,以及我们适应细分的分类攻击,为这项密集的任务提供了第一个全面的基准。我们的结果推动了有关分割任务中鲁棒性评估的当前限制。
translated by 谷歌翻译
机器学习中的歧视通常沿多个维度(又称保护属性)出现;因此,希望确保\ emph {交叉公平} - 即,没有任何子组受到歧视。众所周知,确保\ emph {边际公平}对于每个维度而言,独立不够。但是,由于亚组的指数数量,直接测量数据交叉公平性是不可能的。在本文中,我们的主要目标是通过统计分析详细了解边际和交叉公平之间的关系。我们首先确定一组足够的条件,在这些条件下可以获得确切的关系。然后,在一般情况下,我们证明了相交公平性的高概率的界限(通过边际公平和其他有意义的统计量很容易计算)。除了它们的描述价值之外,我们还可以利用这些理论界限来得出一种启发式,从而通过以相关的方式选择了我们描述相交子组的保护属性来改善交叉公平的近似和边界。最后,我们测试了实际和合成数据集的近似值和界限的性能。
translated by 谷歌翻译
招聘或大学入学等选择问题的歧视通常是由决策者对弱势人口群体的隐性偏见来解释的。在本文中,我们考虑了决策者收到每个候选品质的噪声估计的模型,其方差取决于候选人的组 - 我们认为这种差异方差是许多选择问题的关键特征。我们分析了两个值得注意的设置:首先,噪声差异对于决策者而言是未知的,他只能独立于他们的群体选择最高的估计质量;在第二个中,差异是已知的,决策者挑选了给出嘈杂估计的最高预期质量的候选者。我们表明,两者的基线决策者都会产生歧视,尽管在相反的方向:第一个导致低方差集团的代表性不足,而第二个导致高方差群体的代表性不足。我们研究了对施加公平机制的选择效用的影响,我们将获得$ \ Gamma $ -rule术语(它是古典四分之五规则的延伸,它还包括人口统计奇偶校验)。在第一个设置(具有未知的差异)中,我们证明,在温和的条件下,施加$ \ Gamma $ -rule增加了选择效用 - 在这里,公平与公用事业之间没有权衡。在第二个设置(具有已知的差异)中,施加$ \ Gamma $ -rule降低了该实用程序,但我们由于公平机制而证明了该公用事业损失的束缚。
translated by 谷歌翻译
总体总和聚类是一个凸优化问题,其解决方案可用于多元数据的聚类。我们提出并研究了该方法的局部版本,并特别表明它可以将随机球模型中的任意关闭球分开。更确切地说,我们证明了一个定量绑定在连接的分离集合集群中发生的误差。我们的界限是根据数据点数和功能的本地化长度表示的。
translated by 谷歌翻译